Évaluation des annotations : ses principes et ses pièges
نویسندگان
چکیده
A lot of data is produced by NLP (automatic systems) and for NLP (reference corpus, for computational linguistics or for machine learning) and should be publicly released only if their consistency is proven. While the growing effort that has been made in this direction over the past two decades is encouraging, for example through the increasing use of inter-annotating agreement measures such as kappa, it is not always accompanied by sufficient knowledge of the principles underlying evaluation or the rigor required for their application. The aim of this paper is to present and question the basic concepts and principles of the domain (e.g., shall we use "chance correction" in agreement measures, and if so, how?), and to illustrate with concrete and quantified examples the consequences of an approximate practice of evaluation. MOTS-CLÉS : accord inter-annotateurs, gold standard, évaluation d’annotations.
منابع مشابه
Sampling Saproxylic Beetles with Window Flight Traps: Methodological Insights
RÉSUMÉ. — Regards méthodologiques sur l’échantillonnage des coléoptères saproxyliques au moyen des pièges-vitres. — Les coléoptères saproxyliques constituent un groupe riche en espèces, souvent petites et cryptiques, et diffi ciles à échantillonner. Différentes méthodes sont traditionnellement utilisées pour les collecter: les techniques (i) de collecte active, (ii) d’élevage et (iii) de piégea...
متن کاملModélisation des satisfactions personnelle et interactive d'agents situés coopératifs
RÉSUMÉ. Cet article aborde le problème de l’évaluation, par l’agent, de ses actions et interactions. Nous proposons un modèle des satisfactions différenciant actions individuelles et interactions avec les agents voisins. La satisfaction personnelle est calculée incrémentalement dans le temps suivant la perception de la progression de la tâche en cours. La satisfaction interactive est une évalua...
متن کاملUne introduction à la Set-Theory
Cet article se propose d'introduire les concepts de base de la Set-Theory aussi bien dans l'approche « classique » d'Allen Forte que dans les développements récents de la théorie « transformationnelle » de David Lewin. Malgré l'abondance de publications autour de la Set-Theory dans les Universités et les centres de recherche Nord-américains, cette approche reste souvent peu connue en Europe dan...
متن کاملThe Twelve Principles of Incentive Pay
Reproduction partielle permise avec citation du document source, incluant la notice ©. Short sections may be quoted without explicit permission, if full credit, including © notice, is given to the source. CIRANO Le CIRANO est un organisme sans but lucratif constitué en vertu de la Loi des compagnies du Québec. Le financement de son infrastructure et de ses activités de recherche provient des co...
متن کاملAccès personnalisé à des sources de données multiples: évaluation de deux approches de reformulation de requêtes
RÉSUMÉ. Les systèmes de médiation actuels permettent un accès transparent à un ensemble de sources de données hétérogènes. Le but de la personnalisation est de faciliter l’expression du besoin de l’utilisateur et lui permettre d’obtenir des informations pertinentes en exploitant au mieux ses préférences regroupées dans un profil. Dans un contexte de médiation, la personnalisation doit tenir com...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- TAL
دوره 57 شماره
صفحات -
تاریخ انتشار 2016